17 research outputs found
Writer identification and verification in handwritten documents
In this communication we apply an Information Retrieval model for the writer identification task. Queries are
handwreitten document images projected on a suitable feature set. The handwritten document database is indexed
according to the vector space model originaly used for textual information. The approach uses both the image and
textual description of handwritten documents. Identified documents are then processed by the verification stage. We use
a mutual information criterion so as to verify that each identified document can have been written by the writer of the
query. Decision operates using an hypothesis test. The approcah is evaluated on two different database and proves to
be robust to the variability of handwriting. Perspectives are oriented towards the use of large handwritten document
databaseDans cette communication, nous appliquons un modĂšle de recherche dâinformation pour la tĂąche
dâidentification du scripteur. Les requĂȘtes sont des images de documents qui sont tout dâabord projetĂ©es dans
un espace de caractéristiques. La base de documents manuscrits est indexée selon le principe du modÚle
vectoriel de recherche dâinformation textuelle. Lâapproche exploite donc Ă la fois la reprĂ©sentation mixte image
et textuelle spĂ©cifique dâun document manuscrit. Les documents identifiĂ©s Ă lâissue de cette Ă©tape font
ensuite lâobjet dâune analyse complĂ©mentaire pour vĂ©rifier les hypothĂšses Ă©mises. Nous proposons dâutiliser
un critĂšre dâinformation mutuelle pour vĂ©rifier que chacun des documents identifiĂ©s peut avoir Ă©tĂ© produit par
le scripteur de la requĂȘte. Nous utilisons un test dâhypothĂšse Ă cet effet. Lâapproche est testĂ©e sur deux bases
dâĂ©critures diffĂ©rentes et montre une grande robustesse aux diffĂ©rentes Ă©critures. Lâapproche semble donc
trĂšs intĂ©ressante pour des applications Ă plus grande Ă©chelle nĂ©cessitant dâinterroger des bases de
documents manuscrits